1 Toepassing

De one sample t-toets wordt gebruikt om aan de hand van één steekproef het gemiddelde van de totale populatie te vergelijken met een vooraf opgestelde hypothese 1.

2 Onderwijscasus

De opleidingsdirecteur van de opleiding Werktuigbouwkunde wil weten of het gemiddelde eindexamencijfer voor de exacte vakken (Wiskunde, Natuurkunde en Scheikunde; WNS) van vwo studenten hoger is dan het landelijk gemiddelde (6,8)2. Zo kan zij bepalen of het curriculum van de inleidende vakken genoeg aansluit bij eerstejaars studenten met een vwo vooropleiding.

H0: Het gemiddelde eindexamencijfer voor de exacte vakken van vwo studenten die beginnen aan de Bachelor Werktuigbouwkunde is lager dan of gelijk aan het landelijk gemiddelde: µ = 6,8.

HA: Het gemiddelde eindexamencijfer voor de exacte vakken van vwo studenten die beginnen aan de Bachelor Werktuigbouwkunde is hoger dan het landelijk gemiddelde: µ ≠ 6,8.

3 Assumpties

3.1 Normaliteit

De t-toets gaat ervan uit dat de data normaal verdeeld is. Controleer deze assumptie met de volgende stappen:
1. Controleer de data visueel met een histogram, een boxplot of een Q-Q plot.
2. Toets of de data normaal verdeeld is met de Kolmogorov-Smirnov test of bij een kleinere steekproef (n < 503) met de Shapiro-Wilk test 4.
3. Als blijkt dat de data niet normaal verdeeld is, transformeer de data en kijk daarna of het normaal verdeeld is.

Als er geen sprake is van normaliteit, gebruik de Wilcoxon Signed Rank Test 5.

4 Uitvoering in R

Er zijn twee dummy datasets Gemiddeld_cijfer_WNS en Gemiddeld_cijfer_WNS_n30 ingeladen met de gemiddelde eindexamencijfers van WNS van eerstejaars Werktuigbouwkunde (uit Studielink). Het eerste bestand bevat 122 middelbare scholierenstudenten en het tweede bevat 30 studenten.

4.1 Test assumpties: normaliteit

Bekijk de data via mean(), sd().

mean(Gemiddeld_cijfer_WNS)
## [1] 7.084426
sd(Gemiddeld_cijfer_WNS)
## [1] 0.8356957

Geef normaliteit visueel weer met een histogram, boxplot of Q-Q plot.

Histogram met GGplot

library(ggplot2)
library(plotly)
h <- ggplot(data.frame(Gemiddeld_cijfer_WNS), aes(x = Gemiddeld_cijfer_WNS)) +
  geom_histogram(aes(y = ..density..),
                 binwidth = 0.5, color = "grey30", fill = "#0089CF") + 
  geom_density(alpha = .2, adjust = 1) +
  ylab("Frequentiedichtheid") +
  xlab("Gemiddeld_cijfer_WNS") +
  scale_x_continuous(labels = as.character(seq(5.5, 9, 0.5)), breaks = seq(5.5, 9, 0.5)) +
  labs(title = "Eindcijfers Wiskunde, Natuurkunde en Scheikunde", subtitle = "Eerstejaarsstudenten Werktuigbouwkunde")
ggplotly(h)

Het histogram laat een belcurve zien vergelijkbaar met een normale verdeling: veel waardes liggen rondom het gemiddelde en weinig bij de staarten van de verdeling. Daarnaast ziet de verdeling er in grote mate symmetrisch uit.

Q-Q plot

Gebruik qqnorm() en qqline(). Gebruik pch = 20 om gevulde datapunten te creëren.

qqnorm(Gemiddeld_cijfer_WNS, pch = 20)
qqline(Gemiddeld_cijfer_WNS)

Als over het algemeen de meeste datapunten op de lijn liggen, kan aangenomen worden dat de data normaal verdeeld is. In deze casus liggen de meeste punten op de lijn behalve bij de uiteinden.

Boxplot

boxplot(Gemiddeld_cijfer_WNS, xlab = "Werktuigbouwkunde", ylab = "Gemiddeld_cijfer_WNS")

De boxplot geeft de spreiding van het gemiddelde eindexamencijfer voor de exacte vakken voor de opleiding Werktuigbouwkunde weer.


Om te controleren of de data, ondanks eventuele afwijkende punten of een scheef lijkende verdeling, normaal verdeel is, kan de normaliteit getoets worden. Hierbij een toelichting bij twee veel gebruikte toetsen: de Kolmogorov-Smirnov test en de Shapiro-Wilk test.

Kolmogorov-Smirnov (met Lilliefors correctie)

library(nortest)
lillie.test(Gemiddeld_cijfer_WNS)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  Gemiddeld_cijfer_WNS
## D = 0.053958, p-value = 0.5182

De Kolmogorov-Smirnov test toetst het verschil in vorm tussen twee verdelingen. In deze casus toetst deze test het verschil tussen een normale verdeling en de verdeling van de steekproef. De Lilliefors correctie is een correctie die wordt gebruikt als het gemiddelde niet 0 is en de standaardafwijking niet 1 is. Als de p-waarde groter is dan 0,05 is de verdeling van de data niet significant verschillend van de normale verdeling.

De p-waarde is p > 0,05, dus er is geen significant verschil gevonden tussen de verdeling van de steekproef en de normale verdeling. Er wordt aan de assumptie van normaliteit voldaan, dus de one sample-t-toets kan uitgevoerd worden.

Shapiro-Wilk test

shapiro.test(Gemiddeld_cijfer_WNS_n30)
## 
##  Shapiro-Wilk normality test
## 
## data:  Gemiddeld_cijfer_WNS_n30
## W = 0.97612, p-value = 0.7158

De Shapiro-Wilk test is een soort gelijke test als de Kolmogorov-Smirnov test en wordt vooral gebruikt bij kleine steekproeven. Als de p-waarde groter is dan 0,05 is de verdeling van de data niet significant verschillend van de normale verdeling.

De p-waarde is p > 0,05, dus er is geen significant verschil gevonden tussen de verdeling van de steekproef en de normale verdeling. Er wordt aan de assumptie van normaliteit voldaan, dus de one sample-t-toets kan uitgevoerd worden.


4.2 One sample t-toets

Gebruik t.test()om een t-toets uit te voeren. Geef het gemiddelde waarmee wordt vergeleken en specifieer welke alternatieve hypothese er getoetst wordt. In de praktijk wordt meestal tweezijdig getoetst6.

t.test(Gemiddeld_cijfer_WNS, mu = 6.8, alternative = "two.sided")
## 
##  One Sample t-test
## 
## data:  Gemiddeld_cijfer_WNS
## t = 3.7593, df = 121, p-value = 0.0002638
## alternative hypothesis: true mean is not equal to 6.8
## 95 percent confidence interval:
##  6.934637 7.234216
## sample estimates:
## mean of x 
##  7.084426
  • Het gemiddelde van de steekproef is 7,08
  • Vrijheidsgraden, df = n -1 = 122-1 = 121
  • p-waarde < 0,05, dus de H0 wordt verworpen en de HA wordt aangenomen
  • t (121) = 3,76, p < 0,01
  • 95%-betrouwbaarheidsinterval: bij het herhalen van het onderzoek zal in 95% van de gevallen de µ in het interval vallen. In deze casus is het interval tussen 6,96 en 7,23.

5 Rapportage

De one sample t-toets is uitgevoerd om te toetsen of het gemiddelde eindexamencijfer voor de exacte vakken van vwo studenten die Werktuigbouwkunde zijn gaan studeren, hoger is dan het landelijk gemiddelde. Het gemiddelde van de steekproef (M = 7,08, SD = 0,8) is significant hoger dan het landelijk gemiddelde van 6,8, t (121) = 3,76, p < 0,01.

De resultaten ondersteunen de conclusie dat het gemiddelde eindexamencijfer voor de exacte vakken hoger ligt voor studenten Werktuigbouwkunde met een vwo vooropleiding, dan het landelijk gemiddelde.


  1. van Geloven, N. (25 mei 2016). T-toets [Wiki Statistiek Academisch Medisch Centrum]. https://wikistatistiek.amc.nl/index.php/T-toets#one_sample_t-toets

  2. Centraal Instituut voor Toetsontwikkeling (2018). Examenverslag 2018. https://www.cito.nl/onderwijs/voortgezet-onderwijs/centrale-examens-voortgezet-onderwijs/tools-en-informatie-voor-docenten/examenverslagen/examenverslag-2018

  3. Laerd statistics. (2018). Testing for Normality using SPSS Statistics. https://statistics.laerd.com/spss-tutorials/testing-for-normality-using-spss-statistics.php

  4. Normaliteit. (14 juli 2014). [UvA Wiki Methodologiewinkel]. https://wiki.uva.nl/methodologiewinkel/index.php/Normaliteit

  5. Prabhakaran, S. (2016-2017). Statistical Tests [r-statistics.co]. http://r-statistics.co/Statistical-Tests-in-R.html

  6. Knottnerus, J. A., & Bouter, L. M. (2001). The ethics of sample size: Two-sided testing and one-sided thinking. Journal of Clinical Epidemiology, 54(2), 109-110.